在 Mapping 里面,将 dynamic 参数设置成 strict 可以拒绝索引包含未知字段的文档。 此条 Tips 由 medcl 贡献。

Elasticsearch 6/7/8 到 Easysearch 2.x 迁移指南

EasysearchINFINI Labs 小助手 发表了文章 • 0 个评论 • 40 次浏览 • 3 小时前 • 来自相关话题


![](https://infinilabs.cn/img/blog ... er.jpg)

最近在协助客户进行 Elasticsearch 到 Easysearch 的迁移时,发现大家最关心的问题是"当前版本能否直接使用快照迁移"。这个问题看似简单,但不同版本的答案差异较大。本文将基于实际测试经验,梳理各版本的迁移路径和注意事项。

迁移路径速览


根据源 ES 版本,可以直接对照下表选择迁移方案:

| 源 ES 版本 | 能否直接快照恢复 | 推荐方案 | 实施复杂度 |
| -------------- | :--------------: | ------------------------------------- | :--------: |
| ES 6.x | 否 | INFINI Gateway 迁移 或 ES 7.10.x 中转 | 较低 |
| ES 7.0 - 7.11 | 是 | 直接快照恢复 | 较低 |
| ES 7.12 - 7.17 | 否 | INFINI Gateway 迁移 | 较低 |
| ES 8.x | 否 | INFINI Gateway 迁移 | 较低 |

结论:ES 7.0-7.11 是迁移最顺畅的版本窗口,可直接快照恢复;其他版本也有成熟的迁移方案,只是路径不同。

版本差异的原因


迁移路径的差异主要源于两方面:Lucene 版本兼容性和快照元数据格式变化。

Lucene 兼容性:Easysearch 2.x 底层要求的最低 Lucene 版本对应 ES 7.0.0。ES 6.x 的索引文件使用老版本 Lucene,直接恢复会报错:

<br /> The index was created with version [6.8.23] but the minimum compatible version is [7.0.0].<br />

快照元数据格式:ES 7.12 开始在快照中引入 uuidcluster_id 字段,7.14 增加 writer_uuid,8.x 又引入 transport_version。这些字段与 Easysearch 2.x 的快照解析器不兼容。

因此,ES 7.0-7.11 成为迁移的"黄金窗口"——既满足 Lucene 兼容性要求,快照格式又足够简洁。

ES 7.0-7.11:直接快照恢复


这是测试最充分的迁移路径,已验证版本包括 ES 7.0.1、7.8.1、7.10.2 OSS、7.11.2。

已验证能力:

  • 单索引 / 多索引 / 通配符批量恢复
  • 常见字段类型与别名
  • 自定义 settings、多分片索引
  • ILM 托管索引、数据流后备索引、冻结索引

    操作步骤:

    ```bash

    1. 源 ES 创建快照

    PUT /_snapshot/my_backup/snapshot_1
    {
    "indices": "索引列表",
    "include_global_state": false
    }

    2. Easysearch 注册同一快照仓库

    PUT /_snapshot/my_backup
    {
    "type": "fs",
    "settings": {
    "location": "/path/to/snapshot/repo",
    "readonly": true
    }
    }

    3. 恢复快照

    POST /_snapshot/my_backup/snapshot_1/_restore
    {
    "indices": "索引列表",
    "include_global_state": false
    }
    ```

    ES 6.x:Gateway 迁移或中转方案


    ES 6.x 无法直接快照恢复到 Easysearch 2.x,有两种迁移方案可选:

    方案一:INFINI Gateway 迁移(推荐)

    直接使用 Gateway 从 ES 6.x 迁移数据到 Easysearch,无需中转集群。Gateway 已验证支持 ES 6.8.x 的数据迁移。

    方案二:ES 7.10.x 中转

    <br /> ES 6.8 -> 快照 -> ES 7.10.x -> 快照 -> Easysearch 2.x<br />

    ES 7.10.x 可以正常恢复 ES 6.x 的快照,恢复完成后再创建快照供 Easysearch 使用。该方案数据完整性有保障,但需要额外的中转存储和迁移窗口。

    ES 6.x 特有字段:ES 6.x 的 string 类型在 Easysearch 中需映射为 textkeyword(根据实际使用场景选择)。

    ES 7.12+ 和 8.x:INFINI Gateway 迁移


    这两个版本段的快照格式与 Easysearch 2.x 不兼容,推荐使用 INFINI Gateway 进行迁移。Gateway 是 INFINI Labs 提供的数据迁移工具,专门针对 Elasticsearch 到 Easysearch 的迁移场景进行了优化。

    架构示意


    <br /> ┌─────────────────┐ ┌─────────────────┐ ┌─────────────────┐<br /> │ Elasticsearch │ ──── │ INFINI Gateway │ ──── │ Easysearch │<br /> │ (源集群) │ │ (迁移工具) │ │ (目标集群) │<br /> └─────────────────┘ └─────────────────┘ └─────────────────┘<br />

    Gateway 内部通过 Scroll API 从源集群分批拉取数据,再通过 Bulk API 写入目标集群,整个过程对业务透明。

    主要优势


  • 配置简单:只需配置源集群和目标集群地址、索引名称即可
  • 断点续传:支持从断点恢复,避免网络抖动导致重头再来
  • 进度可视:实时显示迁移进度和速率
  • 多索引并行:支持同时迁移多个索引

    基本步骤


    1. 在目标集群创建索引的 mapping 和 setting
    2. 准备 Gateway 配置文件,填写源集群和目标集群连接信息
    3. 运行 Gateway 执行迁移
    4. 迁移完成后进行数据校验

      详细的配置说明和操作示例,可参考 [ES 数据迁移之 INFINI Gateway](https://infinilabs.cn/blog/202 ... teway/)。

      备选方案


      如果需要更灵活的控制,也可以自行编写脚本,通过 Scroll API 读取源数据、Bulk API 写入目标。这种方式适合有定制化需求的场景,但需要自行处理断点续传、错误重试等逻辑。

      字段类型兼容性


      直接兼容类型textkeywordlongdoublebooleandateobjectnestedgeo_pointgeo_shapeipcompletionwildcardflattenedaliasjoinrank_featurerank_featuresinteger_rangelong_rangedate_rangematch_only_text 等。

      ES 7.x / 8.x 需替换类型

      | ES 类型 | Easysearch 替代方案 | 数据保留 | 说明 |
      | ------------------------- | ------------------------ | :------: | --------------------------------- |
      | dense_vector | knn_dense_float_vector | 是 | 需安装 knn 插件,向量数据格式兼容 |
      | knn_vector | knn_dense_float_vector | 是 | 需安装 knn 插件 |
      | sparse_vector | knn_sparse_bool_vector | 是 | 需安装 knn 插件 |
      | constant_keyword | keyword | 是 | 需手动维护常量值 |
      | runtime | 移除或转为普通字段 | 是 | Easysearch 不支持运行时字段 |
      | histogram | object | 是 | 聚合 histogram 功能丢失 |
      | aggregate_metric_double | object | 是 | 需手动计算聚合 |
      | unsigned_long | longkeyword | 是 | 注意数值范围 |
      | semantic | 暂不支持 | - | ES 专有 AI 功能 |

      向量迁移要点:ES 的 dense_vector 数据可直接迁移到 Easysearch 的 knn_dense_float_vector,数据格式 [0.1, 0.2, ...] 完全兼容。需预先在目标索引创建正确的 mapping。

      建议迁移前先用小索引测试,确认 mapping 无问题后再全量迁移。

      常见问题与避坑指南


      1. include_global_state 参数设置


      该参数控制是否恢复集群级配置(模板、ILM 策略等)。不同版本的情况:

      | ES 版本 | 发行版 | global_state | 说明 |
      | -------- | ------- | ------------ | -------------------------------- |
      | 7.0-7.7 | 任意 | 兼容 | 无 _index_template API |
      | 7.8-7.10 | OSS | 兼容 | 无内置 _index_template |
      | 7.8-7.10 | default | 可能不兼容 | 取决于是否使用 _index_template |
      | 7.11+ | 任意 | 不兼容 | 有 9 个内置 _index_template |

      建议:迁移时统一使用 include_global_state=false,先恢复数据再重建配置。

      2. ILM 和 data stream 迁移


  • ILM:索引的 lifecycle 设置保留,但 policy 需在 Easysearch 中重建
  • 数据流 (data stream):后备索引 (backing index) 数据完整恢复,语义需在目标侧重建
  • 冻结索引 (frozen index):自动恢复为普通可访问状态

    3. 迁移验收标准


    建议至少完成三项验证:

  • 文档量一致
  • 关键查询结果一致
  • 核心业务链路压测通过

    4. 迁移窗口规划


  • 快照方案通常需要短停机窗口完成切换
  • Gateway 迁移可实现近实时同步,仅在切换连接时短暂停服

    快照格式变化参考


    | 字段 | ES 7.0-7.11 | ES 7.12-7.17 | ES 8.x | Easysearch 2.x |
    | ------------------- | :---------: | :----------: | :----: | :------------: |
    | min_version | 7.9.0 或无 | 7.12.0 | 7.12.0 | 支持 |
    | uuid(仓库级) | 无 | 有 | 有 | 不支持 |
    | cluster_id | 无 | 有 | 有 | 不支持 |
    | writer_uuid | 无 | 有(7.14+) | 有 | 不支持 |
    | transport_version | 无 | 无 | 有 | 不支持 |

    总结


    本文梳理了 Easysearch 2.x 对 ES 6/7/8 的迁移路径:

  • ES 7.0-7.11:直接快照恢复,路径最短
  • ES 6.x:INFINI Gateway 迁移 或 ES 7.10.x 中转
  • ES 7.12+ / 8.x:使用 INFINI Gateway 迁移

    建议在正式迁移前,先选择非核心索引进行小规模验证,确认数据完整性和业务兼容性后再扩大迁移范围。

    如有迁移相关问题,欢迎联系我们。

【搜索客社区日报】第2242期 (2026-06-02)

社区日报God_lockin 发表了文章 • 0 个评论 • 628 次浏览 • 1 天前 • 来自相关话题

1. 生产环境检索翻车?带你扒一扒那些隐藏的致命大坑!(需要梯子)  
https://dev.to/rharige/why-sea ... -4m5a

2. 警报拉满!ES 生产内存告急导致 CPU 飙升?实战排查与自救指南!(需要梯子)  
https://dev.to/alok_shankar/el ... -3c8k

3. 一年狂搂百万消息!在 ES 平台上搞 AI Agent 的血泪经验与核心避坑指南!  
https://www.elastic.co/blog/bu ... tform

4. 驯服 ES 的 JVM 猛兽:从指标监控到内存调优的生存指南!  
https://www.elastic.co/blog/jv ... earch

5. ES 9.4 重磅发布!自带 Workflows 工作流,PromQL 语法原生支持,这也太秀了吧!  
https://www.elastic.co/blog/wh ... 9-4-0


编辑:斯蒂文  
更多资讯:http://news.searchkit.cn

【搜索客社区日报】第2243期 (2026-06-03)

社区日报kin122 发表了文章 • 0 个评论 • 857 次浏览 • 1 天前 • 来自相关话题

1.从Vector Database到Vector Lakebase,如何定义AI data infra的下一个十年
https://mp.weixin.qq.com/s/hDRvR7Z8W8dE6EAYz9-6oQ

2.Elasticsearch 如何通过 synthetic _id 和 Bloom filters 将时序存储降低 34%
https://elasticstack.blog.csdn ... 03484

3.使用 Jina CLIP v2 和 Elasticsearch 实现多语言图片搜索
https://elasticstack.blog.csdn ... 10772

编辑:kin122    
更多资讯:http://news.searchkit.cn

【搜索客社区日报】第2241期 (2026-06-01)

社区日报Muses 发表了文章 • 0 个评论 • 2005 次浏览 • 3 天前 • 来自相关话题

1、我们如何在 Elasticsearch Serverless 上将向量搜索吞吐量提升一倍
https://elasticstack.blog.csdn ... 07464
2、1 年与100万条消息之后:在 Elasticsearch 平台上构建 AI agents 的经验教训
https://elasticstack.blog.csdn ... 19911
 
3、OpenClaw与Hermes:源码里的 AI Agent 架构知识大复盘
https://mp.weixin.qq.com/s/49dxdMXEUoWIYlIh8fFqMQ
 
4、AI Coding 的下一阶段:从会写代码,到会按流程写代码
https://mp.weixin.qq.com/s/iaZPoPfrppw2scqWGvlZ_Q
 
5、从零到跑起来: Easysearch 信创环境安装全流程
https://infinilabs.cn/blog/202 ... form/
 
编辑:Muse
更多资讯:http://news.searchkit.cn
 

【搜索客社区日报】第2240期 (2026-05-28)

社区日报Se7en 发表了文章 • 0 个评论 • 3621 次浏览 • 6 天前 • 来自相关话题

1.Impeccable Live Mode 深度分析:把 AI 设计迭代接到真实页面上
https://mp.weixin.qq.com/s/pF0m9MoXGH8JNdvd5QV7fA
2.万字入门AI Infra:深入理解大模型中的数学与Infra优化
https://mp.weixin.qq.com/s/EHXBbN-G5X05rKTo1GpQkA
3.AI Infra入门干货总结:大模型是如何高效推理的
https://mp.weixin.qq.com/s/gCRMjGry2EmBmv1CFfCzVQ

编辑:Se7en
更多资讯:http://news.searchkit.cn

【搜索客社区日报】第2239期 (2026-05-27)

社区日报kin122 发表了文章 • 0 个评论 • 5104 次浏览 • 2026-05-27 10:45 • 来自相关话题

1.捕捉不可见的错误:我是如何为肯尼亚的 HIV 项目构建一个重复数据检测 agent 的
https://blog.csdn.net/UbuntuTo ... 09534

2.Elastic-caveman:将AI Output Token减少64%
https://cloud.tencent.com/deve ... 74688

3.停止升级模型——通过集成多文档 RAG 功能的应用程序来改进检索功能(LangChain、Streamlit 和 FAISS)
https://medium.com/ai-in-plain ... 4f206


编辑:kin122    
更多资讯:http://news.searchkit.cn

【搜索客社区日报】第2238期 (2026-05-25)

社区日报God_lockin 发表了文章 • 0 个评论 • 5909 次浏览 • 2026-05-25 22:40 • 来自相关话题

  1. 老司机是怎么在银行系统里把事件检测时间从45分钟缩减到5分钟的(需要梯子)
    https://medium.com/%40aliakram ... 0f7fb

  2. 稀疏向量的上下文排序可解?可以的可以的老铁!(需要梯子)
    https://medium.com/adeo-tech/s ... 3eb69

  3. 稀疏向量的上下文排序可解?可以的可以的老铁!(需要梯子)
    http://news.searchkit.cn/

  4. 当红炸子PG在文本搜索能和ES掰腕子吗?(需要梯子)
    https://medium.com/%40rosgluk/ ... 29dc0

  5. AWS OpenSearch TLS 升级生存指南(需要梯子)
    https://aws.plainenglish.io/su ... b5811


    编辑:斯蒂文
    更多资讯:http://news.searchkit.cn

【搜索客社区日报】第2237期 (2026-05-25)

社区日报God_lockin 发表了文章 • 0 个评论 • 5906 次浏览 • 2026-05-25 22:29 • 来自相关话题

  1. Elasticsearch 从入门到精通系列(需要梯子)
    https://dogukanngumus.medium.c ... ba02e
  2. Elasticsearch 从入门到精通系列(需要梯子)
    https://dogukanngumus.medium.c ... 1d620
  3. Elasticsearch 从入门到精通系列(需要梯子)
    https://dogukanngumus.medium.c ... a527f
  4. 不阻断PHP的前提下把TPS提高到1000你敢信?(需要梯子)
    https://awstip.com/scaling-tel ... 70521
  5. 扔了那些没用的证书,证明你是个真正的猎手吧(需要梯子)
    https://medium.com/%40huntforw ... 8857a

    编辑:斯蒂文
    更多资讯:http://news.searchkit.cn

【搜索客社区日报】第2237期 (2026-05-25)

社区日报Muses 发表了文章 • 0 个评论 • 5986 次浏览 • 2026-05-25 14:43 • 来自相关话题

1、在 Elasticsearch 中,存储向量查询速度最高提升 3 倍
https://elasticstack.blog.csdn ... .5502

2、用于调试 LLM 延迟、成本和 GPU 饱和度的 ES|QL 查询
https://elasticstack.blog.csdn ... .5502

3、一个神级 PPT Skill,20 天 3600+ Star,背后藏着 AI 最新红利趋势
https://mp.weixin.qq.com/s/jKuNO3tNwDiOR9DyiEcUFQ

4、AI 团队协作案例:全链路研发提效实践分享
https://mp.weixin.qq.com/s/xfbYbbektVm_QcQ1M2NGkw

5、开源 Claude Code 本地代码知识图谱:code-review-graph 完整上手攻略
https://mp.weixin.qq.com/s/D2WBfa_FDfgz2n6sndLIVg

编辑:Muse
更多资讯:http://news.searchkit.cn

【搜索客社区日报】第2236期 (2026-05-22)

社区日报Fred2000 发表了文章 • 1 个评论 • 7780 次浏览 • 2026-05-22 16:24 • 来自相关话题

1、从 0 到 1 构建电商千人千面——基于 Easysearch 的个性化搜索与推荐系统实战
https://mp.weixin.qq.com/s/YkjONLHe7BIXRPHLiUwTbg

2、深入理解 Elasticsearch 写入与查询机制
https://mp.weixin.qq.com/s/YkjONLHe7BIXRPHLiUwTbg

3、Elasticsearch 6/7/8 到 Easysearch 2.x 迁移指南
https://infinilabs.cn/blog/202 ... uide/

编辑:Fred
更多资讯:http://news.searchkit.cn

【搜索客社区日报】第2235期 (2026-05-21)

社区日报Se7en 发表了文章 • 0 个评论 • 8452 次浏览 • 2026-05-21 12:52 • 来自相关话题

1.基于 Harness + SDD + 多仓管理模式的 AI 全栈开发实践|得物技术
https://mp.weixin.qq.com/s/ygQGSH5c7GHYDvkqWoQTXQ
2.Kubernetes 跑 AI Agent,缺的不只是算力——AgentCube 补上了什么
https://mp.weixin.qq.com/s/gwfSgeCGc9HaW6RcaGnzNw
3.AI Infra 其实没有多少新东西
https://mp.weixin.qq.com/s/Hg8uPMjTMX8Tk7slrVvfNA

编辑:Se7en
更多资讯:http://news.searchkit.cn

【搜索客社区日报】第2234期 (2026-05-20)

社区日报kin122 发表了文章 • 0 个评论 • 9376 次浏览 • 2026-05-20 10:09 • 来自相关话题

1.曾经红极一时的Hadoop,已经沦为二线平台?
https://mp.weixin.qq.com/s/cCpZv6vekrDLH7wEK3rk6Q


2.ElasticLens:让 Elasticsearch 集群巡检不再 “裸眼读日志”
https://elasticstack.blog.csdn ... 81746


3.在 Elasticsearch 中使用利润率与流行度加权来优化电商搜索
https://elasticstack.blog.csdn ... 66393




编辑:kin122    
更多资讯:http://news.searchkit.cn

【搜索客社区日报】第2233期 (2026-05-19)

社区日报God_lockin 发表了文章 • 0 个评论 • 10007 次浏览 • 2026-05-19 07:25 • 来自相关话题

1. 什么才是规划集群尺寸真正有价值的因子(需要梯子)
https://codeburst.io/sizing-yo ... bb9da
2. 我是怎么在重建Airbnb的搜索层的(需要梯子)
https://medium.com/%40royabhis ... c0960
 
3. 巅峰掰头 ES和PG 在全文搜索里的对决(需要梯子)
https://medium.com/%40suyash20 ... 50339
编辑:斯蒂文
更多资讯:http://news.searchkit.cn
 

【搜索客社区日报】第2232期 (2026-05-18)

社区日报Muses 发表了文章 • 0 个评论 • 10176 次浏览 • 2026-05-18 14:46 • 来自相关话题

1、Kubernetes 可观测性:用于更安全 EKS 故障排查的 MCP 专家 agents
https://elasticstack.blog.csdn ... 59663

2、通过项目标签和路由,在 Elasticsearch Serverless 中实现更快的跨项目搜索
https://elasticstack.blog.csdn ... 30581

3、重磅新鲜出炉:使用 Elasticsearch 插件将 ES|QL 引入你的 Grafana 仪表盘
https://elasticstack.blog.csdn ... 46123

4、重新定义Skill开发:保姆级教程&一站式开发助手发布
https://mp.weixin.qq.com/s/FgGVPw0BOZEu5sH1FdrVoQ

5、从零设计生产级 Multi-Agent Harness:架构、评估、记忆、成本与 MCP 工具接入全拆解
https://mp.weixin.qq.com/s/JPhcyDc4JwRmnMQ-76A-FQ

编辑:Muse
更多资讯:http://news.searchkit.cn

【搜索客社区日报】第2231期 (2026-05-15)

社区日报Fred2000 发表了文章 • 0 个评论 • 12271 次浏览 • 2026-05-15 10:19 • 来自相关话题

1、让搜索能力像 SQLite 一样无处不在
https://mp.weixin.qq.com/s/7Tn6CI899BZ1mPqCacNvUQ

2、留给内容平台搜索架构转型的时间不多了:从123RF图库放弃OpenSearch聊起
https://mp.weixin.qq.com/s/v3UW0cl_Ga8wfSGgynpSdw

3、如何衡量和提升 Elasticsearch 搜索召回率:通过 混合搜索 从 0.43 提升到 0.75
https://my.oschina.net/u/3343882/blog/19658268

4、不用 Logstash,如何实现 Elasticsearch 的增量数据同步?
https://my.oschina.net/u/5170379/blog/19577824

5、Easysearch analysis-ik 多词典性能优化:从性能回退到分词性能提升 25%~30%
https://mp.weixin.qq.com/s/C5EsDLsF0J0xh-0XX7-L5w

编辑:Fred    
更多资讯:http://news.searchkit.cn